智能论文笔记

Dynamic Restrained Uncertainty Weighting Loss for Multitask Learning of Vocal Expression

Meishu Song , Zijiang Yang , Andreas Triantafyllopoulos , Xin Jing , Vincent Karas , Xie Jiangjian , Zixing Zhang , Yamamoto Yoshiharu , Bjoern W. Schuller

分类：机器学习

2022-06-22

我们提出了一种新型的动态约束不确定性加权损失，以实验处理平衡多个任务对ICML EXVO 2022挑战的贡献的问题。多任务旨在共同认识到声乐爆发中表达的情绪和人口特征。我们的策略结合了不确定性重量和平均动态重量的优势，通过用约束术语扩展权重以使学习过程更具解释。我们使用轻巧的多EXIT CNN体系结构来实施我们提出的损失方法。实验性H-均值得分（0.394）显示出比基线H均值得分的显着改善（0.335）。

translated by 谷歌翻译

Learning to swim efficiently in a nonuniform flow field

Krongtum Sankaewtong , John J. Molina , Matthew S. Turner , Ryoichi Yamamoto

分类：机器学习

2022-12-22

Microswimmers can acquire information on the surrounding fluid by sensing mechanical queues. They can then navigate in response to these signals. We analyse this navigation by combining deep reinforcement learning with direct numerical simulations to resolve the hydrodynamics. We study how local and non-local information can be used to train a swimmer to achieve particular swimming tasks in a non-uniform flow field, in particular a zig-zag shear flow. The swimming tasks are (1) learning how to swim in the vorticity direction, (2) the shear-gradient direction, and (3) the shear flow direction. We find that access to lab frame information on the swimmer's instantaneous orientation is all that is required in order to reach the optimal policy for (1,2). However, information on both the translational and rotational velocities seem to be required to achieve (3). Inspired by biological microorganisms we also consider the case where the swimmers sense local information, i.e. surface hydrodynamic forces, together with a signal direction. This might correspond to gravity or, for micro-organisms with light sensors, a light source. In this case, we show that the swimmer can reach a comparable level of performance as a swimmer with access to lab frame variables. We also analyse the role of different swimming modes, i.e. pusher, puller, and neutral swimmers.

translated by 谷歌翻译

Timing-Based Backpropagation in Spiking Neural Networks Without Single-Spike Restrictions

Kakei Yamamoto , Yusuke Sakemi , Kazuyuki Aihara

分类：神经与进化计算 | 机器学习

2022-11-29

We propose a novel backpropagation algorithm for training spiking neural networks (SNNs) that encodes information in the relative multiple spike timing of individual neurons without single-spike restrictions. The proposed algorithm inherits the advantages of conventional timing-based methods in that it computes accurate gradients with respect to spike timing, which promotes ideal temporal coding. Unlike conventional methods where each neuron fires at most once, the proposed algorithm allows each neuron to fire multiple times. This extension naturally improves the computational capacity of SNNs. Our SNN model outperformed comparable SNN models and achieved as high accuracy as non-convolutional artificial neural networks. The spike count property of our networks was altered depending on the time constant of the postsynaptic current and the membrane potential. Moreover, we found that there existed the optimal time constant with the maximum test accuracy. That was not seen in conventional SNNs with single-spike restrictions on time-to-fast-spike (TTFS) coding. This result demonstrates the computational properties of SNNs that biologically encode information into the multi-spike timing of individual neurons. Our code would be publicly available.

translated by 谷歌翻译

Training Process of Unsupervised Learning Architecture for Gravity Spy Dataset

Yusuke Sakai , Yousuke Itoh , Piljong Jung , Keiko Kokeyama , Chihiro Kozakai , Katsuko T. Nakahira , Shoichi Oshino , Yutaka Shikano , Hirotaka Takahashi , Takashi Uchiyama

分类： (统计)机器学习

2022-08-07

来自重力波检测器的数据中出现的瞬态噪声通常会引起问题，例如检测器的不稳定性以及重叠或模仿重力波信号。由于瞬态噪声被认为与环境和工具相关联，因此其分类将有助于理解其起源并改善探测器的性能。在先前的研究中，提出了用于使用时频2D图像（频谱图）进行瞬态噪声进行分类的体系结构，该架构使用了无监督的深度学习与变异自动编码器和不变信息集群的结合。提出的无监督学习结构应用于重力间谍数据集，该数据集由高级激光干涉仪重力波动台（Advanced Ligo）瞬态噪声与其相关元数据进行讨论，以讨论在线或离线数据分析的潜力。在这项研究的重点是重力间谍数据集中，研究并报告了先前研究的无监督学习结构的训练过程。

translated by 谷歌翻译

Quantum Noise-Induced Reservoir Computing

Tomoyuki Kubota , Yudai Suzuki , Shumpei Kobayashi , Quoc Hoan Tran , Naoki Yamamoto , Kohei Nakajima

分类：机器学习

2022-07-16

量子计算已经从理论阶段转变为实用阶段，在实施物理量子位时提出了艰巨的挑战，物理量子位受到周围环境的噪音。这些量子噪声在量子设备中无处不在，并在量子计算模型中产生不利影响，从而对其校正和缓解技术进行了广泛的研究。但是，这些量子声总是会提供缺点吗？我们通过提出一个称为量子噪声诱导的储层计算的框架来解决此问题，并表明某些抽象量子噪声模型可以诱导时间输入数据的有用信息处理功能。我们在几个典型的基准中证明了这种能力，并研究了信息处理能力，以阐明框架的处理机制和内存概况。我们通过在许多IBM量子处理器中实现框架，并通过模型分析获得了相似的特征内存配置文件来验证我们的观点。令人惊讶的是，随着量子设备的较高噪声水平和错误率，信息处理能力增加了。我们的研究为将有用的信息从量子计算机的噪音转移到更复杂的信息处理器上开辟了一条新的道路。

translated by 谷歌翻译

Verifying Attention Robustness of Deep Neural Networks against Semantic Perturbations

Satoshi Munakata , Caterina Urban , Haruki Yokoyama , Koji Yamamoto , Kazuki Munakata

分类：计算机视觉

2022-07-13

众所周知，深度神经网络（DNNS）通过特别注意某些特定像素来对输入图像进行分类。对每个像素的注意力的图形表示称为显着图。显着图用于检查分类决策基础的有效性，例如，如果DNN对背景而不是图像的主题更加关注，则它不是分类的有效基础。语义扰动可以显着改变显着性图。在这项工作中，我们提出了第一种注意鲁棒性的验证方法，即显着映射对语义扰动的组合的局部稳健性。具体而言，我们的方法确定了扰动参数的范围（例如，亮度变化），该参数维持实际显着性映射变化与预期的显着映射图之间的差异低于给定的阈值。我们的方法基于激活区域遍历，重点是最外面的鲁棒边界，以在较大的DNN上可伸缩。实验结果表明，无论语义扰动如何，我们的方法都可以显示DNN可以与相同基础进行分类的程度，并报告激活区域遍历的性能和性能因素。

translated by 谷歌翻译

Description and Discussion on DCASE 2022 Challenge Task 2: Unsupervised Anomalous Sound Detection for Machine Condition Monitoring Applying Domain Generalization Techniques

Kota Dohi , Keisuke Imoto , Noboru Harada , Daisuke Niizumi , Yuma Koizumi , Tomoya Nishida , Harsh Purohit , Takashi Endo , Masaaki Yamamoto , Yohei Kawaguchi

分类：机器学习 | (统计)机器学习

2022-06-13

我们介绍了声学场景和事件的检测和分类的任务描述（DCASE）2022挑战任务2：“用于应用域通用技术的机器状况监控的无监督异常的声音检测（ASD）”。域转移是ASD系统应用的关键问题。由于域移位可以改变数据的声学特征，因此在源域中训练的模型对目标域的性能较差。在DCASE 2021挑战任务2中，我们组织了一个ASD任务来处理域移动。在此任务中，假定已知域移位的发生。但是，实际上，可能不会给出每个样本的域，并且域移位可能会隐含。在2022年的任务2中，我们专注于域泛化技术，这些技术检测异常，而不论域移动如何。具体而言，每个样品的域未在测试数据中给出，所有域仅允许一个阈值。我们将添加挑战结果和挑战提交截止日期后提交的分析。

translated by 谷歌翻译

Hierarchical Conditional Variational Autoencoder Based Acoustic Anomaly Detection

Harsh Purohit , Takashi Endo , Masaaki Yamamoto , Yohei Kawaguchi

分类：机器学习 | 人工智能

2022-06-11

本文旨在开发一种基于声学信号的无监督异常检测方法来自动机器监测。现有的方法，例如Deep AutoCoder（DAE），变异自动编码器（VAE），条件变异自动编码器（CVAE）等在潜在空间中的表示功能有限，因此，异常检测性能差。必须为每种不同类型的机器培训不同的模型，以准确执行异常检测任务。为了解决此问题，我们提出了一种新方法，称为层次条件变化自动编码器（HCVAE）。该方法利用有关工业设施的可用分类学等级知识来完善潜在空间表示。这些知识也有助于模型改善异常检测性能。我们通过使用适当的条件证明了单个HCVAE模型对不同类型机器的概括能力。此外，为了显示拟议方法的实用性，（i）我们在不同领域评估了HCVAE模型，（ii）我们检查了部分分层知识的影响。我们的结果表明，HCVAE方法验证了这两个点，并且在AUC得分度量上最大的15％在异常检测任务上的基线系统的表现优于基线系统。

translated by 谷歌翻译

Active Domain-Invariant Self-Localization Using Ego-Centric and World-Centric Maps

Kanya Kurauchi , Kanji Tanaka , Ryogo Yamamoto , Mitsuki Yoshida

分类：机器人 | 人工智能

2022-04-22

在自主机器人导航中，对视觉场所识别（VPR）的次数最佳观看（NBV）计划者的培训是一项重要的任务，典型的方法是使用目标域中收集的视觉体验作为培训数据。但是，对于实时的机器人应用，在日常导航中收集了各种各样的视觉体验。我们通过采用小说{\ it domain-invariant} NBV计划来解决这个问题。假定基于卷积神经网络（CNN）的标准VPR子系统可用，并建议将其域不变状态识别能力转移以训练域不变的NBV计划者。具体而言，我们将CNN模型可用的视觉提示分为两种类型：输出层提示（OLC）和中间层提示（ILC）。 OLC可在CNN模型的输出层上可用，旨在估计机器人的状态（例如，机器人观点）相对于以世界为中心的视图坐标系。 ILC在CNN模型的中间层中可用，作为对以自我为中心的视图的视觉内容（例如显着图像）的高级描述。在我们的框架中，ILC和OLC被映射到国家向量，随后用于通过深入的强化学习来训练多视NBV规划师。使用公共NCLT数据集的实验验证了提出方法的有效性。

translated by 谷歌翻译

Cross-Speaker Emotion Transfer for Low-Resource Text-to-Speech Using Non-Parallel Voice Conversion with Pitch-Shift Data Augmentation

Ryo Terashima , Ryuichi Yamamoto , Eunwoo Song , Yuma Shirahata , Hyun-Wook Yoon , Jae-Min Kim , Kentaro Tachibana

分类：机器学习

2022-04-21

通过语音转换（VC）的数据增强已成功应用于仅可用于目标扬声器的中性数据时，已成功地应用于低资源表达文本到语音（TTS）。尽管VC的质量对于这种方法至关重要，但学习稳定的VC模型是一项挑战，因为在低资源场景中的数据量受到限制，并且高度表达的语音具有很大的声学变化。为了解决这个问题，我们提出了一种新型的数据增强方法，该方法结合了变化和VC技术。由于换挡数据的增强功能可以覆盖各种音高动态，因此即使只有目标扬声器中性数据的1000个话语，它也可以极大地稳定VC和TTS模型的训练。主观测试结果表明，与常规方法相比，具有拟议方法的基于快速2的情绪TTS系统改善了自然性和情绪相似性。

translated by 谷歌翻译